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© procede et installation de sequencage de I'ADN. 

(g) Le procede selon I'invention comporte essentiellement 
une etape (2) de fragmentation de I'ADN, une 6 tape (4) de 
reactions chimiques sp6ctfiques des bases constituant I'ADN 
pour former des families de chaTnes de tailles differentes dont 
Tune des extremites est constitute d'une base spectfique, une 
etape (6) de marquage speciflque de ces chaTnes avec des 
isotopes stables, une etape (10) de separation des chaTnes par 
electrophorese, une etape d'atomisation et d'lonlsation (12) 
des chaTnes separ6es, une etape (14) de selection et de 
detection en temps reel des ions par spectrometrie de masse et 
une etape de traitement (16) des signaux detectes pour 
reconstltuer PADN de depart. 
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Description 

PRO CEDE ET INSTALLATION DE SEQUENCAGE DE L'ADN. 

L' invention se rapporte a un procede et une installation de sequencage de molecules biologiques 
complexes telles que PADN (acide desoxyribonucleique), TARN (acide rlbonucleique), les proteines. Elle 
5 s 'applique dans les domain es du genie genetique, de la btologie, de la pharmacologie, tant au stade de 
!' experimentation, de la recherche fondamentale qu'industrielle. 

Le sequencage qui en fait est i'identification des sequences ou de Pordre des nucl6otides ou des acides 
amines des molecules complexes a pris une reelle importance dans le domaine de la biologie moleculatre et de 
ia biotechnologie. En particulier, le sequencage d'un acide nucteique (ADN ou ARM) permet Panalyse des 
10 genomes animaux, vegetaux et viraux dans des genes particuliers. Puisque la fonction d'une molecule 
biologique est determinee par sa structure, la definition de la structure d'un gene est cruciaie pour la 
manipulation eventuelle de cette unite de base d 'information. 

Le procede de Pinvention s'applique de facon generals a toutes molecules constitutes d'une succession de 
nucleotides ou d'acides amines et plus specialement a PADN. On rappelie qu'un nucleotide est forme par une 
15 base, un sucre et un phosphate. 

Pour les acides nucleiques, les bases sont des bases azotees possedant une structure heterocyclique du 
type purique ou pyrimidtque ; elies sont au nombre de 4. Le sucre est le ribose pour PARN et le desoxyribose 
pour PADN. 

Generalement, les nucleotides des acides nucleiques utilises sont triphosphates car c'est ce type de 
20 molecules qui fournlt Penergie necessaire au fonctionnement des enzymes dans de nombreuses reactions 
biochi miques, en particulier celles intervenant dans ia polymerisation des ADN, 

L'ARN et PADN pr6sentent trois bases communes : Padenine (A) et la guanine (G) qui sont des purines et la 
cytosine (C) qui est une pyrimidine, L'autre base pyrimidique est la thymine (T) pour PADN et Puracife (U) pour 
PARN. 

25 Pour PADN, ies quatre types de nucleotides concernes sont le desoxy adenosine triphosphate ou dATP, Je 
desoxy guanine triphosphate ou dGTP, le desoxy cytosine triphosphate ou dCTP et le desoxy thymine 
triphosphate ou dTTP. On les note ci-apres dxTP avec X « A, G, C ou T, 

L'ADN contient Pinformatlon genetique complete necessaire a la fabrication des proteines, elements 
constitutifs de tout organisme vivant En particulier, chaque succession de trois bases est le code, par 

30 Pintermediaire des ARN messagers, d'un acide amine qui entre dans ia composition d'une proteine. Le 
sequencage a pour but d'obtenir Pordre des bases constituant un brin d'ADN ou d'ARN. 

Les methodes de sequencage de PADN comportent essenttellement 5 etapes qui sont (a) la fragmentation 
du genome, (b) les reactions chimiques de sequencage pour former des chaTnes de nucleotides, (c) le 
marquage des chaTnes de nucleotides, (d) la separation des chaTnes marquees et (e) la detection. 

35 

Etape a 

Un genome ou ensemble des secteurs de PADN est constitue par un grand nombre de paires de bases (13 x 
10 6 pour ia levure et 3 x 10 9 pour Phomme). Le genome, du fait de sa longueur, ne peut &tre directement 
soumis aux reactions de sequencage. L'ADN est scinde en fragments d'environ 1000 a 30000 bases qui sont 
40 ensuite multiplies par clonage. Par exemple, cette fragmentation peut etre effectuee par Putilisation 
d'enzymes de restriction qui coupent PADN au niveau de certalnes sequences ou par Putilisation des 
ultra-sons, comme expose dans Particle "Current Approaches to DNA Sequencing" de J.C. Moores, Analytic 
Biochemistry 163, 1-8 (1987). 

45 Etape b 

Elie consiste a appllquer aux chaTnes obtenues en (a) quatre series de reactions chimiques specifiques des 
quatre bases de PADN, Ces factions conduisent a Pobtention de quatre families de chaTnes d'ADN dont Pune 
des extremites est communement fixee et Pautre est constitute d'une base specifique de Pune des quatre 
series de reaction. 

50 Deux methodes sont communement utilisees pour obtenir les 4 families de chaTnes d'ADN ci-dessus. L'une, 
developee par Maxam et Gilbert (Maxam A.M. et Gilbert W„ Proc. NatL Acad. Sci., U.S.A., vol. 74, N° 2, pp 
560-564 de 1977, W A new method for sequencing DNA") fait appel a une procedure de degradation chimique 
des chaTnes et Pautre, introduite par Sanger (Sanger F. et ah, Proc. Natl. Acad. Sci. USA 74, pp. 5453-5467 de 
Decembre 1977 "DNA sequencing with chain-terminating inhibitors") est une methode enzymatique et 

55 emploie un procede de termlnaison de chaTnes didesoxy. 

Dans la methode de Sanger, chacune des quatre reactions de sequencage met en jeu un grand nombre 
d'exemptaires d'ADN monocat6naire a sequencer ; un amorceur (ou en terminologie anglo-saxonne primer) 
qui est un oiigo-nucieotide complementaire de Pune des extremites de PADN a sequencer ; ies quatre 
nucleotides dXTP ; une enzyme qui permet la fabrication du brin complementaire de I'ADN a sequencer, a 

60 partir des nucleotides et en commencant par Pamorceur et enfin un seui des quatre di-desoxy nucleotides 
appele nucleotide terminal et note ddXTP. Ce ddXTP est un nucleotide auquel II manque le groupement OH du 
carbone 3' du desoxyribose. 

L'amorceur se lie a PADN a sequencer par complementartte puts Penzyme synthetase le brin 
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cornplementaire jusqu'a ce qu'elle incorpore le ddXTP arretant ('elongation de la chatne, ^incorporation du 
nucleotide terminal peut se produire n'importe quand au cours de la synthese ce qui se traduit, a la fin de 
('operation de sequencage speclfique d'une base X donnee, par la presence d'une famille d'ADN representant 
toutes les longueurs possibles depuis Pamorceur jusqu'a environ 400 nucleotides. 

Appliquee en parailele pour les quatre ddXTP, la serie de quatre reactions conduit a un ensemble de quatre 5 
families de chaTnes d'ADN ; les chaTnes de chaque famille etant representatives d'une base X donnee sont 
ensuite deposees sur un gef d'eiectrophorese. 

Dans la methode de Maxam et Gilbert, des chaTnes d'ADN de dimensions adaptees et analogues a ceiles 
issues du precede de Sanger sont produites par un traitement chimique d'ADN purifi6. Cette operation permet 
de sequencer un ADN mono- ou bicat6naire marque avec un phosphate radioactif a Tune de ses extremites, 10 

Pour chacune des quatre series de reaction de sequencage, I'ADN est soumis a un jeu de deux reactions 
chimiques. la premiere reaction chimique modifie et retire la base de son sucre, la seconde coupe I'ADN en 
retirant le sucre ainsi expos6. On obtient ainsi des chatnes commencant a un endroit fixe et se terminant par 
une base connue. Les conditions de reaction sont ajustees de facon a produire des chaTnes de toutes les 
longueurs possibles comportant typiquement de 1 a 400 nucleotides. is 

Etape c 

Les chaTnes obtenues en (b) sont marquees prealablement, ou au cours des reactions, avec des marqueurs 
radioactifs. Les marqueurs radioactifs utilises sont le 32 P ou ie 36 S» le tritium, le 14 C qui sont des emetteurs de 
rayonnementsp-, 20 

Dans le cadre de la methode de Sanger, il est possible de marquer I'amorceur, les dXTP ou les ddXTP. 

Etape d 

Les chaTnes d'ADN marquees sont alors separees suivant leur longueur, les plus petites migrant le plus vite 
et les plus grandes le plus lentement Ce gel d'e/ectrophorese qui est en general un gel de poiyacryJam/de 25 
permet de drfferencier les molecules de longueur N et N -M avec N variant de 1 a 400 environ. 

L'electrophorese dure de 4 a 12 heures suivant la longueur du gel qui est ensuite seche. 

Etape e 

Le gel est ensuite place centre un film sensible au rayonnement beta. Les marqueurs radioactifs incorpores 30 
dans les chaTnes d'ADN sont utilises pour developper une image auto-radiographique de chaque trace 
electrophordtique. L'auto-radiographie est developpee apres 12 heures ou plus deposition au rayonnement. 

La position relative des bandes qui apparaissent sur l'image auto-radiographique, au seln des quatre 
colonnes correspondant aux quatre families de reactions, permet la determination de la sequence des bases 
de I'ADN de depart. 35 

Apres la lecture, I'examen et ('interpretation de i'auto-radjographie, la sequence est entree dans la memoire 
d'un ordinateur pour une analyse et un assemblage ulterieurs. 

Ces deux methodes de sequencage d'ADN precedemment decrites sont largement utillsees et component 
chacune plusieurs variantes. Bien que tres performantes et efficaces, ces methodes demandent une mise en 
oeuvre tres complexe qui comporte de serieux inconvenients. C'est en reaiite un tres gros travail deiicat, qui 40 
doit etre extremement bien standardise pour que la source de connaissances et la comparaison des 
migrations electrophoretiques solent fiables. 

Par ailleurs, la lecture des electrophoreses des chaTnes radioactives se fait apres auto-radiographie. La 
aussi, une parfaite reproductibiiite est de rigueur tant dans le d6ve!oppement de ces auto-radiogrammes que 
dans leur lecture, 45 

En effet, Timage sur film d'une bande de gel radioactif est plus large que la band© elle-mdme et la 
comparaison des positions des bandes entre les quatre pistes differentes de l'electrophorese (qui peuvent 
fnduire un comportement non uniforme quant aux mobiiites des chaTnes) peut limiter la resolution 
effectivement observee sur I'auto-radlogramme et done reduire la longueur de la sequence qui peut etre lue a 
partir des gels. Typiquement, de 200 a 400 bases peuvent etre lues a partir d'un simple jeu de traces. 50 

De plus, les Irregularites survenant d'un trace a un autre peuvent rendre difficile ia lecture automatique des 
auto-radiogrammes par des techniques d'imagerie existantes (par exemple densitometres a balayages) car 
I'oeil humain peut actuellement mieux discriminer ces irregularites que ne ie font les ordinateurs. 

La n6cessite d'un soin intensif quant a Panalyse "manueJIe" des auto-radiogrammes dernande done du 
temps et est sujette a des erreurs. 55 

Par ailleurs, I'utiiisation de marqueurs radioactifs presente de serieux inconvenients quant a la manipulation 
(systeme de protection complexe des operateurs et decontamination periodique des installations), au 
stockage des produits durant ('analyse et au stockage des dechets en fin d'anaiyse 

Enfin, II n'est pas possible d'observer les bandes au sein du gel pendant l'electrophorese afin de controler 
['operation en cours, mais il faut ndcessairernent terminer l'electrophorese a un moment determine et attendre eo 
le deveioppement de I'auto-radlogramme avant de pouvoir lire ia sequence. 

Aussi, plusieurs procedes ont deja envisage la detection en temps reel des chaTnes d'ADN pendant leur 
migration au cours de l'electrophorese. 

Les uns s'interessent par exemple a la detection du rayonnement p- emis par les chaines marquees au 32 P, 
les autres s'interessent a ia detection de remission de fluorescence induite par un faisceau laser. 65 
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Dans le premier cas, la detection en ligne (ou temps r6ei) des bandes radioactives au cours de 
I'electrophordse peut permettre une certaine simplification, par une certaine reduction du nombre des 
operations a effectuer, pour I'ensemble du procede. Cependant, il faut tenir compte de la courte periode de 
demi-vie du phosphore 32 et par consequent de I'instabiiite des reactifs de marquage radioactif. En outre, 
5 comma dans les methodes plus traditionnelles de Sanger ou Maxam et Gilbert, il demeure que des problemes 
sont poses par ('elimination et la manipulation des produits radioactifs. 

En outre, ie temps de passage des chaTnes devant le detecteur etant tres reduit, ceia implique une plus 
faible efficacite de collection des rayonnements, ce qui peut entraTner des problemes de sensibilite et de 
resolution. 

10 La detection de remission de fluorescence induite par un faisceau laser a ete proposes par Ansorge (voir 
DE-A-3 618 605 et ['article Journal of Biochemical and Biophysical Methods. 13(1986), pp 315-323, "A 
non-radioactif automated method for DNA sequence determination". Gette methode utilise un seui 
fluorophore pour marquer I'amorceur (ou primer) dans le cadre de ia methode de Sanger. 

Dans ce cas, les quatre series de reactions de sequencage conduisent, comme decrit precedemment, a 
15 quatre families de chaTnes d'ADN d6posees sur quatre pistes paralieles d'un gel d'electrophorese, qui est 
traverse entierement, suivant sa iargeur, par un faisceau laser. Au sein du gel, les chaTnes d'ADN marquees 
sont excitees les unes apres les autres, dans I'ordre de la sequence, lorsqu'elles passent dans le faisceau 
laser, au cours de I'electrophorese. 

Pour chaque piste d'electrophorese associee a une famiile de reactions donnee, la lumiere de fluorescence 
20 est collectee par une optique adaptee et conduite, apres filtrage, a un detecteur de type photomuitiplicateur. 
Un avantage offert par cette technique est ('absence de toute partie mobile au sein de Tappareii de 
d6tection grace aux detecteurs fixes qui permettent une detection continue sur les quatre pistes 
d'eJectrophordse. 

Toutefois, I'utilisation d'un seul fluorophore conduit inevitablement a ('utilisation de quatre pistes en 
paraliele, sur fe gel d'electrophorese. pour I'etude d'une seuie sequence, ce qui limite les possibitites 
devolution sensible et de simplification ulterieures. II en est de m£me lors de la detection en temps reel des 
chaTnes d'ADN marquees par du phosphore 32. 

Ces systemes de detection en temps reel necessitent aussi une grande fiabilite quant a la comparaison des 
mobiiites electrophoretiques d'une piste a J'autre. Or, en pratique, plusieurs difficultes peuvent etre 
30 rencontres ; en particulier, la formation de gradient thermique et ia presence d'irnpuretes au sein du ge! 
peuvent induire des distorsions locales des chaTnes au sein du gel, et par suite compromettre directement 
f'attribution des bases dans la sequence cherchee. 

D'autres procedes de detection en temps reel proposent I'utilisation de plusieurs fluorophores afin 
d'identifier individueiiement chaque famiile de chaTnes. Ce type de procede presente Tavantage, dans son 
concept, d'offrir la possibilit6 de separer des chaTnes d'ADN issues des reactions de sequencage, sur une 
seule et meme piste d'electrophorese. Ces systemes utilisent une serie de quatre fluorophores, ce qui sembie 
repondre aux divers problemes souiignes precedemment. Toutefois, la mise en oeuvre specifique de chacun 
de ces systemes ne rend ces approches que partiefiement reussfes. 

Un premier systeme a ete propose par LM. Smith et al. (voir FR-A-2 558 262), dans le cadre des reactions 
40 de sequencage de Sanger. Dans cette technique, les reactions de sequencage doivent s'effectuer dans 
quatre tubes separes, chacun comprenant un marqueur fluorescent different lie au "primer". L'appareil de 
detection decrit par Smith et al. utilise une serie de fiitres interfere ntiels a bande etroite afin de selectionner les 
longueurs d'onde specifiques d'emisslon de chacun des fluorophores. 
A partlr de ce procede relativement simple, le type de systeme qui en resulte comporte au demeurant 
45 certaines imperfections. En particulier, de serieux problemes sont engendres par I'utilisation de molecules 
fiuorescentes de charges et de tailfes tres differentes. 

Cette situation se traduit par I'existence de perturbations au cours de I'electrophorese dues aux differences 
de mobiiites electrophoretiques des diverses chaTnes marquees differemment. En effet, malgre ('elaboration 
conjointe d'un logiciel lourd et assez complexe de traitement et de correction des donnees, ces ph6nomenes 
peuvent entraTner certains recouvrements voire des inversions de chaTnes au cours de Teiectrophorese, 
empechant ou meme faussant I'identification de certaines bases le long de la sequence. 

Par ailieurs. cette technique requiert obligatoirement I'utilisation de quatre "primers" specifiques marques. 
Ceci entraTne, dans les cas ou d'autres vecteurs sont employes, la necessite d'entreprendre des processus 
longs et complexes de synthdse et de purification de quatre nouveaux "primers" fluorescents. 

Un second systeme propose par J.M. Prober et al. (voir EP-A-0 252 683) repose, toujours dans le cadre des 
reactions Sanger, sur I'utilisation de quatre fluorophores lies aux quatre ddXTP. Ce marquage different des 
ddXTP procure un certain nombre d'avantages. En particulier, les quatre reactions de sequencage peuvent 
s'effectuer dans un m£me tube, un amorceur unique non marque peut alors 6tre utilise et les produits de 
reaction peuvent Stre separes au sein d'une meme colonne d'electrophorese. 
60 Cependant, le fait de greffer au ddXTP des marqueurs extrinseques, c'est-a-dire les fluorophores, qui sont 
des molecules assez complexes et tres voiumineuses (les fluorophores utilises sont dans ce cas les derives 
de la fluoresceins), peut entraTner des decaiages imprevisibles dans les mobiiites de certaines chaTnes au 
cours de I'electrophorese et surtout restreindre fortement le choix d'enzymes de complementartte ; ceci 
ehmine ia possibility d'utilisation des enzymes courantes, comme par exemple le fragment de Kfenow d'ADN 
65 polymerase. 
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L'invention a done pour objet un procede d'identification des sequences d'un ADN permettant de remedier 
& la plupart des inconvenients donnes precedemment Des problemes similaires apparaissant dans le 
sequencage de tout autre acide nucleique et, en particulier, dans les ARN, 1'invention s'appiique a tout type 
d'acide nucleique. 

Aussi, l'invention a pour objet un proced6 d'identification de ta sequence des bases d'un acide nucleique 5 
comportant essentieilement : 

a) une etape de production de fragments a sequencer, 

b) une etape de reactions chimiques sp6cifiques desdites bases pour former des families de chatnes 
de tallies differentes dont I'une des extre mites est constitute d'une base specif ique, 

c) une etape de marquage specif ique desdites chatnes avec des isotopes ou petites molecules stables, 10 

d) une etape de separation des chatnes marquees, 

e) une etape d'atomisation et d'ionisation de chaque chatne marquee puis, 

f) une etape de detection en temps reel des ions formes par spectrometrie de masse. 

Le fonctionnement en temps reel est lie au fait que, dans I'invention, les ions sont d6tectes au fur et a 
mesure de leur formation. 15 

Le procede selon i'invention, grace a rutilisation de trois, quatre ou plusieurs isotopes ou petites molecules 
stables, e'est-a-dire non radioactives, done non dangereuses pour les operateurs, facilite considerablement 
les interventions humaines dans ie procede de sequencage. En outre, I'ionisation des chatnes marquees puis 
la detection de ces chatnes par un spectrometre ou analyseur de masse facilite considerablement la detection 
des chatnes marquees et done le sequencage des acides nucleiques. 20 

Le procede de i'invention fonctlonne en continu et ne comporte pas d 'etape de radiographic selon Part 
anterieur, longue et delicate. 

En outre, i'ionisation et la spectrometrie de masse permettent I'utilisation de marqueurs lies de maniere 
intrinseque ou extrinseque aux differents nucleotides, ce qui autorise ('application de ce procede aux diverses 
methodes chimiques de sequencage les plus repandues, et en particulier, celles de Sanger ou de 25 
Maxam-Giibert relatives au sequencage de I'ADN. 

Par petites molecules, ii faut comprendre des composes chimiques pouvant etre lies aux nucleotides et qui 
comportent au moins un element marqueur identifiable par spectrometrie de masse, tel que CF2, Si(CH 3 )3, en 
utilisant par exemple une technique decrite dans I'articie Tetrahedron Letters, vol. 26, N° 40, pp. 4915-4918 
(1985) CD. Pein, D. Cech. 30 

L'invention a aussi pour objet une installation d'identification de la sequence des bases d'un acide nucleique 
comprenant : 

- une source de chatnes de nucleotides de tallies differentes, marquees par des isotopes ou petites molecules 
stables, 

- des moyens de separation de ces chatnes marquees, 35 

- des moyens d'atomisation et d'ionisation des chatnes sortant des moyens de s6paration, 

- un spectrometre de masse pour selectionner et detecter ies ions et 

- des moyens de traitement des signaux fournis par le spectrometre. 

De facon avantageuse, on utilise comme moyen de separation des chatnes marquees, un dispositif de 
chromatographie monopiste afin d'eliminer les erreurs de comparaison entre plusieurs pistes comme dans 40 
I'art anterieur. 

Des problemes similaires a ceux decrits precedemment pour le sequencage de i'ADN pouvant intervenfr 
lors de ('identification de la sequence des acides amines d'une proteine et de la determination d'une protane 
particuliere dans un melange de proteines, Invention a encore pour objet un procede d'identification d'une 
proteine dans un melange de proteines ou de ses acides amin6s, comportant essentieilement : 45 

- une etape de marquage specifique desdits acides amines avec des isotopes ou de petites molecules 
stables, 

- une etape de separation des prolines marquees, 

- une etape d'atomisation et d'ionisation de chaque proteine marquee puis, 

- une 6tape de detection en temps reel des ions formes par spectromeine de masse. 50 
L'invention a encore pour objet un procede d'identification de ia tailie des fragments de molecules 

bioiogiques complexes, comprenant essentieliement : 

- une etape de marquage des fragments, 

- une etape de separation selon leur tailie, des fragments marques specifiquement et meles a des standards 

de tailie, 55 

- une etape d'atomisation et dMonisation des fragments puis une detection en temps reel des ions par 
spectrometrie de masse. 

D'autres caracteristiques et avantages de l'invention ressortiront de la description qui suit, donnee a titre 
iliustratif et non limitatif aux dessins annexes, dans lesquels : 

- Ia figure 1 represente un schema d'ensemble des etapes de sequencage automatise d'ADN selon 60 
l'invention, 

- la figure 2 represente un schema d'ensemble d'une installation automatisee pour le sequencage 
d'ADN conforme a I'invention, 

- ia figure 3 represente le type de donnees produites par un sequencage d'ADN selon l'invention. 

La description qui va suivre se refere au sequencage de I'ADN, bien que, comme on Ta dit precedemment, 65 
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['invention s'applique a tout acide nucleique (ARN par exemple) ou toute proline compiexe. 

La premiere etape du procede, en reference a la figure 1 , consiste a f ragmenter un genome d'ADN (etape a), 
conformement a Tart anterieur cite. Cette etape de fragmentation porte ia reference 2 sur la figure 1. 
Les chaTnes obtenues sont alors soumises aux reactions de sequencage (etape b) selon les methodes 
5 usuelles si ce n'est que Pechelle peut etre augmentee, en cas de besoin pour fournir une intensit6 de signal 
adequate pour ia detection de chaque famiile de chaTnes. Aucun nucleotide radio marque n'a besoin d'etre 
inclu dans les reactions de sequencage. Les reactions de sequencage sont symbolisees par le bloc 4 sur la 
figure 1. 

Le marquage des chaTnes obtenues, symbolise par le bloc 6, peut etre realise en utiiisant un isotope ou une 
10 combinaison d'isotopes stables, constituants eventuels de petites molecules stables, afin de marquer 
specifiquement les chaTnes issues de chacune des quatre series de reactions chimiques. 

Le marquage isotopique selon ('invention des chaTnes d'ADN peut etre realise au niveau de i'un des trois 
composes chimiques constituant les nucleotides, c'est-a-dire la base, le sucre ou le groupement triphosphate 
ou eventuellement sur un groupement aIpha-thiophosphat6 dans iequei I'atome d'oxygene lie au premier 
15 phosphore est remplace par un atome de soufre. 

Le marquage des chaTnes peut etre realise de facon intrinseque sur le carbone, Phydrogene, Pazote, 
Poxygene ou meme le soufre entrant dans la constitution des trois composes chimiques d'un nucleotide. 
L'utiiisatlon d'isotopes naturels stables, selon ('invention, offre un choix plus important que les isotopes 
radioactifs generaiement utilises ( 32 P, 3 S S, 1 14 C, 3 H) pouvant entrer dans la constitution des differents 
20 compos6s nucleotidiques. 

Une liste de ces isotopes stables, incluant leur abondance naturelle relative, est donnee dans le tableau 1 . 

Tableau 1 



isotopes naturels stables pour marquage 
intrinseque des composes nucleotiques 



Isotopes 


Abondance relative (o/o) 


D 


0,015 


13 C 


1.10 


15 N 


0,37 


17o 


0,038 


18o 


0,20 


32 s 


95,02 


33s 


0,75 


34s 


4,21 


36 s 


0,02 



40 Du point de vue chimique, les reactions pour Incorporer un Isotope stable ou un isotope radioactif sont les 
memes. 

Les divers procedes de marquage de molecules bioJogiques par des isotopes stables existent et sont 
largement repandus (voir a cet effet Particle "The preparation of purines, pyrimidines, nucleotides and related 
compounds labelled with 17 0, 18 0, and other stable isotopes" E. Petreanu, J.S. Cohen and D. Samuel. 
45 Proceedings of the 2nd International Conference on methods of preparing and storing labelled compounds, 
pp. 489-497). Differentes molecules marquees, en partlculier les nucleotides peuvent etre produites par vole 
de synthase ou par voie enzymatlque. En particulier, de nombreux composes nucleotidiques marques avec 
des isotopes stables sont disponibies sur le march6 pour des applications en biologie et en pharmacologic 
differentes de celles de ('invention (voir par exemple Particle "Dehaiogenation Reactions in Fast Atom 
50 Bombardment Mass Spectrometry" , Anal. Chem. 1984.56. 1975.77) 

Des exemples de nucleotides marques a I'aide d'isotopes naturels sont donnes dans les annexes I et II. 

Ces exemples ont uniquement pour but d'iilustrer des rnoyens de marquage possibles utilisables dans 
('invention, 

Comme donnees dans ces annexes I et II, le marquage peut s'etendre a toutes les formes de nucleotides et 
55 en particulier aux formes desoxytriphosphate et didesoxytrtphosphate (annexe I) ainsi qu'a leurs analogues 
alpha-thiotriphosphate (annexe II). Ceci autorise le marquage des differentes sortes de chaTnes d'ADN issues 
des divers types de reaction de s6quencage telles que celles issues des methodes de Sanger ou de 
Maxam-Giibert decrites precedemment. 

Comme autre nuc!6otide marque intrinsequement, on peut citer le 1 ou 3- 15 NdATP, Pa- 18 OdCTP, le 
60 4- 1 *OdTTP, le 2- 13 CdATP ou dCTP, le 8- 13 CdATP, le 5'-l3CdATP, Pa-SdATP, Pa-SdGTP, i'a-SdCTP, I'a-SdTTP 
ou S est Pisotope 32, 34, 33 ou 36, le methyl ^CdTTP. 

II est aussi possible, selon Pinvention, d'effectuer un marquage extrinseque des nucleotides. Ce type de 
marquage comporte Pavantage de pouvoir lier au nucI6otide des atomes (sous forme mono ou polyatomique) 
qui ne sont pas naturellement presents dans ces mo!6cules. Ces marqueurs sont constitues d'elements ou de 
65 petits complexes moleculaires d'elements alcalins, alcalino-terreux ou haiogeniques. 
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Dans le cadre des reactions de sequencage, le marquage extrins6que selon invention pr£sente moins de 
risque de denaturer les proprietes physiques et chimiques des nucleotides, contrairement a I'adjonction selon 
Tart anterieur de grosses molecules telles que les chromophores ou fluorophores qui ne peuvent dtre liees 
que par I'intermediaire de bras specifiques relativement complexes. Ainsi, les elements ou petits complexes 
moleculalres selon Pinvention peuvent etre directement greffes au nucleotide en profitant des liaisons 5 
covalentes disponibles au sein de la base ou du sucre de chaque nucleotide (voir par exemple I'article d'Anal. 
Chem. cite precedemment). 

Des exemples de marquage extrinseques selon I'invention sont donnes en annexe Hi. Get exempie donne 
un jeu complet de bases nucleotidiques de TARN marquees extrlnsequement. En particulier, X represente un 
atome de fiuor, de chlore, de brome ou d'iode. 10 

Comme nucleotide marque par des halogenes utilisables dans I'invention, on peut citer le 8-bromo dGTP. le 
5-bromo dCTP, le 3'-bromo, chioro ou iodo dTTP, le 5-bromo iodo ou fluoro dTTP, ie 3'-FdGTP. 

En tenant compte de I'existence de plusieurs isotopes stables possibles des differents marqueurs 
extrinseques (elements halogenes par exemple), les possibilites de marquage isotopiques des nucleotides 
sont fortement accrues, 75 

Une liste des differents isotopes stables d'e16ments halogenes est presentee dans le tableau 2, 
accompagnes de leur abondance naturelle relative. 



13c seul Nucleotide de type A 

13c + 17o Nucleotide de type G 

13c 4- 15n Nucleotide de type C 

15n + 17o Nucleotide de type T 



20 



25 



Tableau 2 

Isotopes naturefs stables des elements halogenes 
pour le marquage extrinseque 

Isotopes Abondance relative (°/o) 

19f 100 

35 C ! 75,77 

37ci 24,23 

79er 50,69 

81 er - 49,31 

127 t 100 30 

Conformement k I'invention, II est possible d'effectuer des marquages multiples des nucleotides des 
chaTnes issues des reactions de sequencage, ces marquages 6tant des marquages intrinseques et/ou 
extrinseques. 55 

En premier lieu, on peut citer des possibilites d'incorporer plusieurs isotopes marqueurs de meme type sur 
un nucleotide donne. Comme nucleotide marqu6 de ce type, on peut citer par exemple le 1 f 3- 15 N dATP, le 
1,3- 15 NdCTP» le 2,8-dichloro ou dibromo ou difiuoro dATP, le 5,5-dibromo dCTP. Ceci permet d'accroTtre 
d'autant la sensibilite obtenue iors de ia detection et de ('identification des chaTnes nucleotidiques. 

En second lieu, plusieurs marqueurs differents peuvent §tre incorpores au sein d'un meme nucleotide afin 40 
d'affiner sa signature. De plus, la detection simultanee de plusieurs marqueurs augmente considerablement 
les combinatsons de marquages possibles. 

L'exemple suivant montre que trois types de marqueurs isotopiques stables suffisent a I'identification de 
quatre nucleotides differents : 



45 



50 



Ainsi, ies marquages intrinseques et extrinseques des nucleotides a Taide d'isotopes stables peuvent etre 
combines et offrent de reelles possibles multiples et variees. 

Cette methods de marquage s f avere plus souple et plus riche devolution que les marquages 
radlo-lsotopiques ou par fluorophores seion Tart anterieur qui restent forcement plus limites dans leurs 55 
possibilites. De plus, la plupart des inconvenients rencontres avec ces derniers Iors de leur manipulation et de 
leur utilisation sont evites voire compietement ellmines. 

Les chaTnes d'ADN marquees sont alors placees dans une source 8 appropriee pour leur separation par 
chromatographie, representee par le bloc 10. 

A cet effet, les chatnes marquees sont introduites dans une colonne de chromatographie ou coionne 60 
d'6lectrophor6se sur gel en vue de les separer suivant leur taille, leur charge ou mdme d'autres proprietes 
physiques. Pour ie sequencage d'ADN, les chaTnes marqu6es dont ia longueur differe d'un simple nucleotide 
sont separees par electrophorese dans une matrice de gel poiyacryiamide. 

li en results que dans ie fond et pres du fond de la colonne de chromatographie, les chaTnes d'ADN sont 
resolues les unes des autres et peuvent etre extraites et prises en compte par une source dMons en vue 65 



7 




EP 0 360 676 A1 



d 'ioniser les chaTnes separees, comme indique par le bloc 12. 

Ensuite les ions sont selectionnes et detectes par spectrometrie de masse comme indiqud en 14 puis ies 
signaux fournis par la spectrometrie de masse sont traites, comme indique en 16, en vue de reconstituer I'ADN 
de depart. 

5 L'installation permettant le sequencage automatise de I'ADN, conformement a ('invention, est schematisee 
sur la figure 2. La fragmentation du genome, les reactions chimiques de sequencage et le marquage etant 
effectues de facon discrete ou de facon ind6pendante dans le temps, ne sont pas representee sur la figure 2. 

^'installation representee comporte une source 18 de chaTnes marquees d'ADN a Paide d'isotopes stables 
sefon Pinvention contenant une cuve 20 destinee a recevoir Pechantillon 21 des chaTnes marqu6es d'ADN 
io mises en solution dans un tampon portee a la haute tension grace a une source d'alimentation electrique 22. 
Le fond de la cuve 20 est muni d'un orifice couple a un tube electrophoretique 24 de 1 mm de diametre 
environ monoplste pouvant contenir un gel polyacrylamide ; I'extremite de sortie 26 du tube constituant une 
anode debouche a Pinterieur d'une source d'ions 28 portee au potentiel de la masse. 

Grace a un Jet de gaz rare et en particulier d'argon, introduit dans la source 28, via une conduit© 30, au sein 
15 du plasma cree electromagnetiquement, les chaTnes marquees Issues du tube electrophoretique 24 sont 
pulverisees sous forme d 'aerosols. 

Differentes sources d'ions adaptees au couplage de differents types de tube electrophoretique peuvent 
etre utilisees. Elles font appei ou peuvent combiner divers processus physiques courants d'atomisation tels 
que P6lectrospray, le thermospray, la nebulisation. 
2Q Les aerosols obtenus sont alors introduits dans une source a plasma 32 equipee de bobines 
electromagnetiques 33 reiiees a un generateur radiofrequence 34. Dans la zone 32a la plus chaude du plasma, 
oCi la temperature atteint 7000 a 8000° K, ies molecules d'ADN sont atomisees et ionisees. 

La torche a plasma est la source preferee d'ionisation seton Pinvention car elle permet Patomisation 
complete des molecules et induit une simplicity maximale dans le spectre de masse obtenu aprds analyse 
25 d'eiements simples. 

Les ions formes sont alors pris en charge par Toptique d'entree 36 d'un spectrometre de masse 38 qui peut 
etre du type secteur magnetique ou un vide differentiel s'installe grace a des pompes primalres et secondaires 
39 ; la pression au niveau de Poptique ionique 36 est de Pordre de 10~ 4 torr (10" 2 Pa) et la pression au niveau 
des pieces polaires 40 du spectrometre est de Pordre de 10~ 6 torr (10 -4 Pa). 
30 Le premier rdfe du spectrometre de masse 38 est de seiectionner et d'identifier grace a son optique ionique 
36 et ses pieces poiaires 40, la presence des masses specif iques obtenues grace au traceur Isotopique utilise 
precedemment Le spectrometre de masse 38 peut operer en mode selectif ce qui consiste a balayer 
uniquement les masses caracteristiques dues a la presence du marqueur isotopique, afin de fournir un 
maximum de sensibiiite. 

35 La detection par spectrometrie de masse permet a la fois de detecter les chaTnes d'ADN marquees au fur et 
a mesure de leur sortie de la coionne chromatographique 24 et d'identifier grace a leur marqueur specifique a 
quel nucleotide elles correspondent. Cette information donne la sequence d'ADN. 

Les molecules ionisees et selectionnees par le spectrometre de masse sont alors detectees a i'aide d'un 
detecteur 42 situ£ a la sortie du spectrometre 38, du type multiplicateur d'electrons et qui est sensible a 

40 I'impact d'un seui ion. Les ions selectionnes peuvent done etre detectes individueilement ce qui favorise 
I'obtention d'une sensibiiite maximale de l'installation totale de s6quencage. 

Le couplage en Hgne d'une source 18 de chaTnes marquees, du tube d'electrophoretique 24, de la source 
d'ions 28 equipee de la torche a plasma 32, et d'un spectrometre de masse 38 equipe de son optique d'entree 
36, de ses pieces poiaires 40 et de son detecteur 42 sont en particulier donnes dans Particle Analytical 

45 Chemistry, vol. 59, n° 8 d'avril 1987, p. 1230 1232, intitule "On-line mass spectrometrie detection for capillary 
zone electrophoresis" ou dans Particle Analytical Chemistry, vol. 52, N° 14 de Decembre 80, p. 2283-2289, 
intitule "Inductively coupled argon plasma as an ion source for mass spectrometrie determination of trace 
elements'*. 

Le signal electrique issu du detecteur 42 est aiors amplifie grace a I'amplificateur 44 avant d'etre recu dans 
50 un micro-ordinateur 46 du type PC qui gere automatiquement, a la fbis le pilotage des divers sous-ensembles 
(18, 28, 38) de ('installation, le traitement et la representation des donnees. 

En fonction du temps, un signal proportionnel au nombre de coups recus par unite de temps par le 
d6tecteur 42 est mesure pour chacune des masses caracteristiques des marqueurs isotopiques utilises. Cette 
information indique ie nucleotide qui caracterise une chaTne d'ADN analysee dont ia longueur est particuliere a 
55 la fenetre temporeiie d 'observation donnee. 

La figure 3 represente le type de donnees obtenues par l'installation representee sur la figure 2. A titre 
explicatif , la ligne Ai correspond a une chaTne marquee de n nucleotides, dont Pune des extremites se termine 
par i'adenine ; ies Hgnes A2 et A3 correspondent, respectivement, a des chaTnes marquees de n~4 et n-9 
nucleotides dont I'une des extremites se termine par ('adenine ; les trois adenines terminates etant marquees 
60 par isotope stable, appele isotope 1. II en est de meme pour les autres bases. 

L'extreme sensibiiite de Pensembie du systeme de detection de i'invention (inferieure au ppb) indique que 
ce procede est tout a fait ad6quat pour effectuer une analyse de sequence d'ADN. 

A titre illustratif, on donne cl-apres, un exemple de sequencage d'un ADN hypothetique, en se referant a la 
figure 3. 

65 L'ADN a sequencer est le TGACTGCACGTA. Aussi, toutes les chaTnes marquees dans la source de 
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chaTnes 8 ou 18 commencent par un T et se terminent par Tune des quatre bases X. Ces chatnes resultent des 
reactions chimiques de sequencage de Sanger ou Maxam/Gilbert. Les chaTnes sent pr6sentes peie-mele 
dans Pechantlllon 21. Eiles comportent de 1 a 12 nucleotides tels que : TGACTGCACGTA, TGACTGCA, TGA, 
TGAC, TGACT, T, TGACTGCAC. 

Ces chaTnes sont separees selon leur taiile par electrophorese (etape 10) dans un tube 24 monopiste. On 5 
obtfent les bandes d'electrophorese suivantes ordonnees de gauche a droite : 
TTT ... T ... TTT 
GGG ... G ... GG 
AAA ... A ... A 

CCC ... C 10 

TTT ... T ... 

GGG ... G 

CCC ... 

AAA 

CCC 15 

GGG 

TT 

A 

Cheque colonne represente une bande d'electrophorese qui contient en fait de Pordre de plusieurs dizaines 
de millions d'exemplaires de chacune des chaTnes. ' - 20 

Ces chaTnes sont ensuite atomisees puis ionisees au fur et a mesure de leur sortie du gel electrophoretique, 
dans la source d'ions 28 (etape 12). 

Les chaTnes TG t TGACTG, etc, se terminant par de la guanine sont atomisees et ionis6es et fournissent un 
marqueur *G de type G. De meme, les chaTnes se terminant par de ('adenine, telles que TGA, TGACTGCA, etc, 
sont atomisees et ionisees et fournissent des marqueurs *A, de type A. De meme, les chaThes se terminant 25 
respectivement par C et T fournissent des marqueurs *C et *T, Ces marqueurs se trouvent meies a d'autres 
ions et, en particulier, a des ions de carbone, azote, oxygene ou hydrogene provenant de I'ionisation des 
chaines, soit : 



N 30 



G* 

H 



35 



Aussi, !e spectrometre de masse 38 (etape 14) permet la selection des marqueurs puis leur detection ion 
par ion. 

La detection, au cours du temps, d'ions caracteristlques des marqueurs utilises permet a la fois de deceler 
la presence des chaTnes d'ADN prises en compte par la source d'ions, et d'identifier leur familie suivant le type 
d'ions marquant leur extremit6. L'ordre de ces marqueurs pris en compte par I'ordinateur 46 (etape 16) donne 40 
Pordre des bases ou sequences de TADN, soit ici GGAC, etc... 

L'invention ayant ete decrite en detail, il est evident que de i'ARN ou d'autres types de molecules 
biologiques complexes peuvent etre analysees grace au procede et a ('installation selon Invention : 
i'eiectrophorese a en effet d'autres applications que le sequencage de PADN. 

Cette technique separative sert aussi a separer des fragments de moI6cules biologiques complexes (ADN, 45 
ARN, proteines) afin de d6terminer leur taiile. Pour se faire, la vitesse de migration de ces fragments est 
comparee a celle de fragments de failles connues, les echantilions etant deposes sur des pistes adjacentes. 
Grace a Pinvention, il est possible de marquer avec des isotopes ou petites molecules stables differentes, les 
differents echantilions ainsi que les marqueurs de taiile. Ceux-cl sont ensuite deposes sur une meme piste 
d'electrophorese puis Introduits en Hgne dans la source du spectrometre de masse. L'atomlsation des 50 
fragments permet d'isoler le marqueur et de le detecter. Le type de marqueur detect6 indique I'appartenance 
du fragment a tel ou tel echantillon et son instant d'arrivee, par rapport aux instants d'arrivee des standards, 
indique sa taiile. 

De plus, ce type de marquage utilise pour marquer certains acides amines d'une proteine permet de 
detecter soit la proteine au sein d'un melange de prot6ine, soit la presence de ces acides amines au sein de 55 
cette proteine. 
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ANNEXE II 
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Revendications 

1. Proced6 d'identificatlon de la sequence des bases d'un acide nucleique comportant essentielle- 
ment : 

55 a) une etape (2) de production de fragments de Pacide nucleique a sequencer, 

b) une etape (4) de reactions chimiques specifiques desdites bases pour former des families de 
chaTnes de taiiies differentes dont Pune des extremites est constitute d'une base specifique, 

c) une etape (6) de marquage specifique desdites chatnes avec des isotopes ou de petites 
molecules stables, 

60 d) une etape (10) de separation des chatnes marquees, 

e) une etape d'atomisation et d'ionisation (12) de chaque chain e marquee puis, 

f) une etape de detection (14) en temps reel des ions formes par spectrometrie de masse. 

2. Procede selon la revendication 1, caracterise en ce que le marquage est realise de facon intrinseque 
avec au moins un isotope choisi parmi D, 13 C, 1S N, 17 0, 18 0, 32 S, 33 S, 34 S et 36 S. 

65 3. Procede selon la revendication 1 ou 2, caracterise en ce que le marquage est realise de facon 
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extrinsdque avec au moins un isotope cholsi parmi 19 F, 35 CI, 37 C\, 79 Br, 81 Br et 127 l. 

4. Proc6de selon i'une quelconque des revendications 1 a 3, caracterise en ce que I'on separe ies 
chaTnes par chromatographie avec une seule piste chromatographique, 

5. Procede selon Tune quelconque des revendications 1 a 4, caracterise en ce que I'acide nucleique est 



6. Proc6de selon fa revendication 5, caract6rise en ce que le marquage est effectue sur Ies bases, Ies 
sucres ou Ies triphosphates des formes desoxy-triphosphatees (dXTP) ou didesoxy-triphosphatees 
(ddXTP) ou de leurs analogues alpha-thiotriophosphatees. 

7. Installation pour ('identification de la sequence des bases d'un acide nucleique comprenant : 

- une source (18) de chaTnes de nucleotides de tallies differentes, marquees par des isotopes ou de 10 
petites molecules stables, 

- des moyens de separation (20, 22, 24, 26) de ces chaTnes marquees, 

- des moyens (28, 30, 32) d'atomisation et d'ionisation des chaTnes sortant des moyens de separation, 

- un spectrometre de masse (38) pour selectionner et detecter Ies ions, et 

- des moyens de traitement (44, 46) des signaux fournls par le spectrometre. 15 

8. Installation selon la revendication 7, caracterisSe en ce que Ies moyens d'ionisation comprennent 
une torch e a plasma (32) . 

9. Installation selon la revendication 7 ou 8, caracte>isee en ce que Ies moyens de separation 
comportent un tube electrophoretique (24) monopiste et des moyens (20, 22, 26) pour assurer le passage 

des chaTnes dans le tube. so 

10, Proc6d6 d'identiftcation d'une proline dans un melange de proteines ou de certains de ses acides 
amines, comportant essentiellement : 

- une etape de marquage sp6cifique desdits acides amines avec des isotopes ou de petites molecules 
stables, 

- une etape de separation des proteines marquees, 25 

- une etape d'atomisation et d'ionisation de chaque prot6ine marqu6e puis, 

- une etape de detection en temps reel des ions formes par spectrometrie de masse. 

1 1. Proced6 d'identification de la faille des fragments de molecules biologiques complexes, comprenant 
essentiellement : 

- une etape de marquage des fragments, 30 

- une etape de separation selon leur taille, des fragments marques specifiquement et meles a des 
standards de taille, 

- une etape d'atomisation et d'ionisation des fragments puis une detection en temps reel des ions par 
spectrometrie de masse. 
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1) DIAGRAMME IDEALISE DE BANDES D'ADN MARQUEES PAR 

OES ISOTOPES STABLES DANS LE GEL D'UN TUBE ELECTROPHORETIQUE 
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1) RESULTAT IDEALISE DE LA DETECTION DES BANDES MARQUEES A PaRTIR DE LA 
REPRESENTATION DU TUBE CI-DESSUS 
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